查看原文
其他

今日Qcon热门分享|腾讯K8s大规模离在线混部与内核隔离实践

2021年5月29-31日Qcon软件大会在北京国家会议中心举行。自2007年3月份开始举办以来,已经有超万名有多年从业经验的技术人员参加过QCon大会。QCon 内容源于实践并面向社区,演讲嘉宾依据热点话题,面向5年以上工作经验的技术团队负责人、架构师、工程总监、开发人员分享技术创新和实践。

云计算平台带来 IT 基础设施巨大变革,每一次 IT 基础设施的变革都会激发开发人员去思考能够充分发挥新平台优势的软件设计和开发方法。“云原生”就是一种充分利用云计算模式的优点来构建和运行应用的方法。


无论是构建新的云原生系统,还是将遗留系统迁移到云原生对于传统开发团队来说都是一件充满挑战的事。


腾讯云3位专家工程师将在2021年5月30日北京国际会议中心举办的Qcon全球软件大会,聚焦于云原生的实践,和大家分享他们在云原生演化过程中收获的经验与教训, 帮助更多的团队少走弯路,成功实践云原生。


专题演讲嘉宾

颜卫

腾讯高级后台开发工程师,专注于Kubernetes大规模集群管理和资源调度,有过万级集群的管理运维经验。目前负责腾讯云TKE大规模Kubernetes集群的大数据应用托管服务。

演讲议题:

腾讯云大数据云原生与在离线混合部署实践


时间地点:

2021年5月30日9:30-10:15 国际会议中心二号厅A

所属专题:

云原生技术应用


议题简介:


随着云原生概念的兴起,越来越多的企业投身于云原生转型的浪潮,以解决传统应用面临的弹性能力不足、资源利用率较低、迭代周期较长等问题。通过云原生技术(如容器、不可变基础设施和声明式 API 等),使得企业在公有云、私有云和混合云等云环境构建和运行应用变得更加容易,更能充分利用云环境的优势,加速了企业应用迭代、降低资源成本、提高系统容错性和资源弹性。


基于 Hadoop 生态的传统大数据系统,同样面临着弹性能力不足、资源利用率低、管理困难等问题,云原生技术天然适合解决这些问题。然而,Hadoop 生态的传统大数据系统改造成云原生架构,涉及到改造成本高、迁移风险大等诸多挑战。


本次分享将分为三部分:


1. 介绍大数据云原生化的挑战与收益,从大数据系统现在的问题出发,分析云原生化对大数据系统的收益,以及这过程中的挑战。

2. 介绍腾讯内部基于流计算,数据湖计算大数据容器化的实践。并介绍如何基于Yarn Operator实现大数据系统的渐进式云原生化。

3. 介绍大数据容器化如何与在离线混部结合,使大数据系统能够利用在线系统中空闲的资源,提升整体资源的使用率。


分享提纲:


1. 大数据云原生的问题与挑战

2. 腾讯云大数据云原生实践介绍

3. 腾讯云云原生在离线混合部署实践介绍

4. 总结与展望



专题演讲嘉宾

徐蓓

腾讯云专家工程师

11年软件架构与研发经验,其中7年云计算经验,在 IaaS、PaaS、离在线混部和云原生大数据领域有丰富的研发与落地经验。

Kubernetes Contributor,开源爱好者。

专题演讲嘉宾

蒋彪

腾讯云高级工程师

12年专注于操作系统技术,在操作系统内核、虚拟化和性能优化相关领域有丰富的研发经验,负载腾讯云底层性能优化和相关研发,Linux Kernel 社区贡献者。

演讲议题:

腾讯 Kubernetes 大规模离在线混部与内核隔离实践


时间地点:

2021年5月30日11:20-12:05 国际会议中心201CD会议室

所属专题:云时代的性能优化


议题简介:


腾讯在大规模 Kubernetes 集群下通过混部技术将在线与离线业务混合部署在一起,以统一调度与提升资源利用率。在这种背景下在线离线负载之间隔离变得尤为重用。传统方式使用 Kernel CGroup NameSpace 等实现资源隔离,有诸多缺点,如隔离粒度不够、无法保证强隔离等。

本分享介绍腾讯 Kubernetes 利用自研内核 QoS 技术,实现主要资源强隔离,在内核层面保证在线离线资源服务质量。在保证业务稳定的前提,将工作节点利用率提升到极致。


分享提纲:


1.腾讯云原生离在线混部背景、现状及发展趋势

2.腾讯 Kubernetes 混部隔离架构与实践

腾讯混部基本原理与核心架构

利用负载预测实现资源超卖

利用资源 QoS 框架实现资源隔离

利用 batch 调度加速调度性能

3.腾讯自研内核隔离技术与实践

CPU 隔离内存隔离IO/网络隔离Quality Monitor

4.混部技术未来展望


听众收益:


1.了解混部资源隔离的关键技术

2.了解腾讯自研内核 QoS 实现原理

3.了解腾讯 Kubernetes 使用自研内核实现资源隔离的原理

4.了解腾讯 Kubernetes 混部的落地效果





往期精选降本增效系列文

① 容器化计算资源利用率现象剖析

② 资源利用率提升工具大全

③ 基于K8s 扩展机制构建云上成本控制系统

后续持续更新中。。。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存